智能论文笔记

Differentially private partitioned variational inference

Mikko A. Heikkilä , Matthew Ashman , Siddharth Swaroop , Richard E. Turner , Antti Honkela

分类：机器学习 | (统计)机器学习

2022-09-23

从分布式敏感数据中学习隐私的模型是一个越来越重要的问题，通常在联邦学习环境中提出。最近通过分区的变异推理算法扩展到了非私有联盟学习设置。为了保护隐私，当前的黄金标准称为差异隐私。差异隐私在强大的数学上明确定义的意义上保证了隐私。在本文中，我们介绍了差异化的分区变异推断，这是学习与联合学习环境中贝叶斯后分布的差异近似的第一个通用框架，同时最大程度地减少了通信弹的数量并为数据主体提供差异隐私保证。我们在通用框架中提出了三个替代实现，一个基于单个方面的本地优化，而两个基于扰动全局更新（一种使用联合平均版本，一个将虚拟方添加到协议中），并比较其属性，并比较其属性理论上和经验。我们表明，只要各方都有足够的本地数据，扰动本地优化与简单且复杂的模型效果很好。但是，每个方始终独立保证隐私。相比之下，扰动全局更新与相对简单的模型最有效。鉴于可以访问合适的安全原始词，例如安全聚合或安全的改组，所有各方都可以共同保证隐私。

translated by 谷歌翻译

Tight Accounting in the Shuffle Model of Differential Privacy

Antti Koskela , Mikko A. Heikkilä , Antti Honkela

分类：机器学习 | (统计)机器学习

2021-06-01

Shuffle模型的差异隐私是一种基于当地隐私机制和可信的混洗机的组合的新型分布式隐私模型。已经表明，与纯粹的局部机制相比，Shuffler提供的附加随机化改善了隐私范围。考虑紧张的界限，特别是对于多留言协议，Shuffler带来的复杂性是复杂的。最近提出的傅里叶会计师进行评估为$（\ varepsilon，\ delta）$ - 差异隐私保障已经显示出比各种复杂机制的非适应性组成的常用方法更严格的界限。在本文中，我们展示了如何使用傅立叶会计师进行傅立叶版本的多消息版本的多消息版本的多消息版本，并展示文献中存在的界限的松动。

translated by 谷歌翻译

Gaussian Processes with Differential Privacy

Antti Honkela , Laila Melkas

分类：机器学习 | (统计)机器学习

2021-06-01

高斯进程（GPS）是非参数贝叶斯模型，广泛用于各种预测任务。以前的工作在通过差异隐私（DP）向GPS增加了强大的隐私保护，仅限于仅保护预测目标的隐私（模型输出）而不是输入。我们通过为模型输入和输出引入DP保护而引入GPS来打破此限制。我们通过使用稀疏GP方法来实现这一目标，并在已知的诱导点上发布私有变分近似。近似协方差调整到大约占DP噪声的增加的不确定性。近似可用于使用标准稀疏GP技术计算任意预测。我们提出了一种使用应用于验证设置日志可能性的私有选择协议的超参数学习方法。我们的实验表明，考虑到足够量的数据，该方法可以在强大的隐私保护下产生准确的模型。

translated by 谷歌翻译

Privacy-preserving Data Sharing on Vertically Partitioned Data

Razane Tajeddine , Joonas Jälkö , Samuel Kaski , Antti Honkela

分类：机器学习 | (统计)机器学习

2020-10-19

在这项工作中，我们引入了一种差异性私有方法，用于从垂直分区的数据\ emph {i.e。}生成合成数据，其中同一个人的数据分布在多个数据持有人或各方之间。我们提出了一种差异性隐私随机梯度下降（DP-SGD）算法，以使用变异推理在此类分区数据上训练混合模型。我们修改了安全的多方计算（MPC）框架，以将MPC与差异隐私（DP）相结合，以便有效地使用差异化的私有MPC来学习DP下在此类垂直分区数据的DP下的概率生成模型。假设混合物组件不包含不同方面的依赖性，则可以将目标函数分解为当事方计算的贡献的产物之和。最后，MPC用于计算不同贡献之间的聚集体。此外，我们严格地定义了系统中不同玩家的隐私保证。为了证明我们的方法的准确性，我们从UCI机器学习存储库上运行算法在成人数据集上，在此我们获得与非分区案例的可比结果。

translated by 谷歌翻译

Explainability via Short Formulas: the Case of Propositional Logic with Implementation

Reijo Jaakkola , Tomi Janhunen , Antti Kuusisto , Masood Feyzbakhsh Rankooh , Miikka Vilander

分类：人工智能

2022-09-03

我们从逻辑和公式大小方面概念化了解释性，在非常一般的环境中给出了许多相关的解释性定义。我们的主要兴趣是所谓的特殊解释问题，旨在解释输入模型中输入公式的真实价值。解释是一个最小尺寸的公式，（1）与输入模型上的输入公式一致，（2）将所涉及的真实价值传输到全球输入公式，即每个模型上。作为一个重要的例子，我们在这种情况下研究了命题逻辑，并表明在多项式层次结构的第二级中，特殊的解释性问题是完整的。我们还将在答案集编程中提供了此问题的实施，并研究了其与解释N-Queens和主导集合问题的答案有关的能力。

translated by 谷歌翻译

The cost of passing -- using deep learning AIs to expand our understanding of the ancient game of Go

Attila Egri-Nagy , Antti Törmänen

分类：人工智能 | 机器学习

2022-08-24

使用深度学习神经网络的AI发动机为分析传统棋盘游戏提供了出色的工具。在这里，我们有兴趣获得对古老游戏的新见解。为此，我们需要根据发动机的原始输出来定义新的数值度量。在本文中，我们开发了一种数值工具，用于以上下文敏感的方式进行自动移动性能评估并识别游戏功能。我们通过传递成本来衡量移动的紧迫性，这是石头当前配置和在同一董事会位置的假设传递之后的得分值差。在这里，我们研究了此度量的属性并描述了一些应用。

translated by 谷歌翻译

Exposing and addressing the fragility of neural networks in digital pathology

Joona Pohjonen , Carolin Stürenberg , Atte Föhr , Esa Pitkänen , Antti Rannikko , Tuomas Mirtti

分类：计算机视觉

2022-06-30

神经网络在许多医学成像任务中都取得了令人印象深刻的结果，但在源自不同医疗中心或患者同类的分布数据集中通常会表现出色。评估这种缺乏概括和解决潜在问题的能力是开发旨在临床实践的神经网络的两个主要挑战。在这项研究中，我们开发了一种新方法，用于评估神经网络模型通过生成大量分配移位数据集的概括能力，可用于彻底研究其对临床实践中遇到的可变性的鲁棒性。与外部验证相比，\ textit {移位评估}可以提供有关为什么在给定数据集上神经网络失败的解释，从而为如何改善模型鲁棒性提供指导。随着评估的转变，我们证明了接受最先进方法训练的神经网络对于甚至从训练数据中的分配很小的转移而高度脆弱，并且在某些情况下会失去所有歧视能力。为了解决这一脆弱性，我们制定了一种增强策略，该策略明确旨在提高神经网络对分配转移的稳健性。 \ texttt {strongaugment}通过大规模的，异构的组织病理学数据进行评估，其中包括来自两种组织类型的五个培训数据集，274个分配切换的数据集和来自四个国家 /地区的20个外部数据集。接受\ texttt {strongaugment}培训的神经网络在所有数据集上都保持相似的性能，即使通过分配变化，使用当前最新方法训练的网络将失去所有歧视能力。我们建议使用强大的增强和转移评估来训练和评估所有用于临床实践的神经网络。

translated by 谷歌翻译

Classification of datasets with imputed missing values: does imputation quality matter?

Tolou Shadbahr , Michael Roberts , Jan Stanczuk , Julian Gilbey , Philip Teare , Sören Dittmer , Matthew Thorpe , Ramon Vinas Torne , Evis Sala , Pietro Lio

分类：机器学习

2022-06-16

在不完整的数据集中对样本进行分类是机器学习从业人员的普遍目的，但并非平凡。在大多数现实世界数据集中发现缺失的数据，这些缺失值通常是使用已建立的方法估算的，然后进行分类现在完成，估算的样本。然后，机器学习研究人员的重点是优化下游分类性能。在这项研究中，我们强调必须考虑插补的质量。我们展示了如何评估质量的常用措施有缺陷，并提出了一类新的差异评分，这些分数着重于该方法重新创建数据的整体分布的程度。总而言之，我们强调了使用不良数据训练的分类器模型的可解释性损害。

translated by 谷歌翻译

Rediscovering Affordance: A Reinforcement Learning Perspective

Yi-Chi Liao , Kashyap Todi , Aditya Acharya , Antti Keurulainen , Andrew Howes , Antti Oulasvirta

分类：人工智能 | 机器人

2021-12-24

可接受的是指对象允许的可能动作的感知。尽管其与人计算机相互作用有关，但没有现有理论解释了支撑无力形成的机制;也就是说，通过交互发现和适应的充分性。基于认知科学的加固学习理论，提出了一种综合性的无力形成理论。关键假设是用户学习在存在增强信号（成功/故障）时将有前途的电机动作与经验相关联。他们还学会分类行动（例如，“旋转”拨号），使他们能够命名和理由的能力。在遇到新颖的小部件时，他们概括这些行动的能力决定了他们感受到的能力。我们在虚拟机器人模型中实现了这个理论，它展示了在交互式小部件任务中的人性化适应性。虽然其预测与人类数据的趋势对齐，但人类能够更快地适应能力，表明存在额外机制。

translated by 谷歌翻译

Quality of Data in Machine Learning

Antti Kariluoto , Arto Pärnänen , Joni Kultanen , Jukka Soininen , Pekka Abrahamsson

分类：机器学习

2021-12-17

根据哪种机器学习模型提高其性能，当他们有更多数据来学习时，存在常见的假设。在这项研究中，作者希望通过使用新颖的职业学生数据进行实证实验来澄清困境。该实验比较了不同的机器学习算法，同时改变了可用于训练和测试模型的数据数量和特征组合。实验表明，数据记录的增加或其样本频率不会立即导致模型精度或性能的显着增加，但是在集合模型的情况下，准确性的方差会减少。在增加模型的输入特征的数量的同时，目睹了类似的现象。该研究驳斥了起始假设，并继续说明，在这种情况下，数据的重要性在于数据的质量而不是数据的数量。

translated by 谷歌翻译